"Un computer per tutti"

Progetto Ateneo 3a Missione

Andrea Vitaletti (Sapienza)

Obiettivi¶

  • Donare PC
  • Analisi Data Driven del fenomeno del Digitla Divide
  • Workshop

Divario Digitale (Digital Divide)¶

Il divario digitale è il divario esistente tra chi ha accesso effettivo alle tecnologie dell'informazione (in particolare personal computer e Internet) e chi ne è escluso, in modo parziale o totale. I motivi di esclusione comprendono diverse variabili: condizioni economiche, livello d'istruzione, qualità delle infrastrutture, differenze di età o di sesso, appartenenza a diversi gruppi etnici, provenienza geografica[2]. Oltre a indicare il divario nell'accesso reale alle tecnologie, la definizione include anche disparità nell'acquisizione di risorse o capacità necessarie a partecipare alla società dell'informazione: nei paesi avanzati, e specie nella popolazione giovane, infatti, il divario di meno accesso alla rete è ormai quasi del tutto colmato e si apre invece un divario digitale di secondo livello basato sulle modalità di fruizione (Wikipedia)

Analisi Data Driven del fenomeno del Digitla Divide¶

  • Focus nella scuola
  • Approccio Iniziale: Questionario
  • Intuizione: Accedere ai log del Resgistro Elettronico

Il registro Elettronico¶

In collaborazione con Axios

Ipotesi¶

Se uno strumento digitale così importante viene usato poco ci può essere un problema di Digital Divide

Data as Excel files¶

Capire la struttura dei dati¶

  • EE = Elementari
  • MM = medie
  • SS = Superiori
  • ACso = il grado per esempio la prima media è MM 1, il quarto superiore è SS 4
  • Alu = Alunni
  • Tut = Tutori
  • Maschio
  • Femmina
  • Italiani
  • Stranieri
In [3]:
import pandas as pd
sheets = ['Dati_Sett 2022','Dati_Ott 2022','Dati_Nov 2022','Dati_Dic 2022','Dati_Gen 2023','Dati_Feb 2023','Dati_Mar 2023','Dati_Apr 2023','Dati_Mag 2023','Dati_Giu 2023']
dfs = []
for sheet in sheets:
    dfs.append(pd.read_excel('Sapienza2.xlsx', sheet_name=sheet))
    
df_months_logs = pd.concat(dfs, ignore_index=True)

Esportare i dati in formato non proprietario¶

In [6]:
df_months_logs.to_csv("months_log.csv",index=False)

Da 0 a 3 stelle!¶

I dati sono disponibili su https://github.com/andreavitaletti/un_computer_per_tutti/

Analisi dei dati¶

In [8]:
import pandas as pd
df_all_from_csv = pd.read_csv("months_log.csv")  

Dati sugli accessi¶

Quanti sono gli accessi mensili per tiplogia di utenti ?¶

In [13]:
months = [9,10,11,12,1,2,3,4,5,6]
accessi_totali_per_mese = []
accessi_totali_tutori_italiani_per_mese = []
accessi_totali_tutori_stranieri_per_mese = []
accessi_totali_alunni_italiani_per_mese = []
accessi_totali_alunni_stranieri_per_mese = []

for month in months:
    mask = (df_all_from_csv['DataLogin'].dt.month == month)
    accessi_totali_per_mese.append(df_all_from_csv.loc[mask]['Totale'].sum())
    accessi_totali_tutori_italiani_per_mese.append(df_all_from_csv.loc[mask]['TutITA'].sum())
    accessi_totali_tutori_stranieri_per_mese.append(df_all_from_csv.loc[mask]['TutSTRA'].sum())
    accessi_totali_alunni_italiani_per_mese.append(df_all_from_csv.loc[mask]['AluITA'].sum())
    accessi_totali_alunni_stranieri_per_mese.append(df_all_from_csv.loc[mask]['AluSTRA'].sum())

Accessi per regione¶

Gli uomini o le donne sono "tutori più partecipi"?¶

In [51]:
# percentuale di tutori femmine che accede al registro elettronico
sum(accessi_totali_tutori_femmine_per_mese)/sum(accessi_totali_tutori_per_mese)
Out[51]:
0.7389560830476684

Gli uomini o le donne sono "alunni più partecipi"?¶

In [47]:
# percentuale di studenti femmine che accede al registro elettronico
sum(accessi_totali_alunni_femmine_per_mese)/sum(accessi_totali_alunni_per_mese)
Out[47]:
0.5239771965124078

Dati sulle classi¶

riferimento solo alla versione 2.0 utilizzato da circa la metà delle nostre scuole (circa 1000)

In [23]:
df1 = pd.read_csv("class_data.csv")  
In [25]:
# classi gestite dal nostro registro (si fa riferimento solo alla versione 2.0 utilizzato da circa la metà delle nostre scuole (circa 1000)
print("Totale alunni:",df1["Alunni"].sum())
print("Totale classi:",df1["Classi"].sum())
Totale alunni: 49169
Totale classi: 2724

NOTA: Mancano dati per alcune regioni (es: Abruzzo)

Indice di "Partecipazione"¶

$$ \text{Indice di partecipazione} = \frac{\text{Accessi degli Alunni per Regione}}{\text{Alunni per Regione}}$$

Ipotesi: Quanto più grande è l'indice di partecipazione tanto minore è il problema del Digital Divide

Numero Accessi per Regione¶

Out[42]:
AluTot
Regione
ABRUZZO 1
BASILICATA 0
CALABRIA 66
CAMPANIA 1579
ESTERO 172
FRIULI VENEZIA GIULIA 42
LAZIO 1602
LIGURIA 3441
LOMBARDIA 9728
MARCHE 148
PIEMONTE 4
PUGLIA 245
SARDEGNA 6
SICILIA 471
TOSCANA 270
UMBRIA 50
VENETO 67

Alunni nelle classi per regione¶

NOTA: mancano dati per alcune regioni

Out[34]:
Alunni
Regione
BASILICATA 447
CALABRIA 4380
CAMPANIA 3044
ESTERO 695
FRIULI VENEZIA GIULIA 1599
LAZIO 5552
LIGURIA 2378
LOMBARDIA 5468
MARCHE 4661
MOLISE 609
PIEMONTE 3042
PUGLIA 4880
SARDEGNA 1967
SICILIA 2991
TOSCANA 4530
UMBRIA 1356
VENETO 1570